home *** CD-ROM | disk | FTP | other *** search
/ Collection of Internet / Collection of Internet.iso / infosrvr / doc / www_talk.arc / 000173_connolly@pixel.convex.com _Tue Jul 14 20:40:47 1992.msg < prev    next >
Internet Message Format  |  1992-11-30  |  3KB

  1. Return-Path: <connolly@pixel.convex.com>
  2. Received: from dxmint.cern.ch by  nxoc01.cern.ch  (NeXT-1.0 (From Sendmail 5.52)/NeXT-2.0)
  3.     id AA01449; Tue, 14 Jul 92 20:40:47 MET DST
  4. Received: by dxmint.cern.ch (dxcern) (5.57/3.14)
  5.     id AA29445; Tue, 14 Jul 92 20:40:28 +0200
  6. Received: from pixel.convex.com by convex.convex.com (5.64/1.35)
  7.     id AA06435; Tue, 14 Jul 92 13:39:59 -0500
  8. Received: from localhost by pixel.convex.com (5.64/1.28)
  9.     id AA10602; Tue, 14 Jul 92 13:39:54 -0500
  10. Message-Id: <9207141839.AA10602@pixel.convex.com>
  11. To: www-talk@nxoc01.cern.ch
  12. Subject: rethinking the HTML DTD.
  13. Date: Tue, 14 Jul 92 13:39:53 CDT
  14. From: Dan Connolly <connolly@pixel.convex.com>
  15.  
  16. I have been troubled by the fact that HTML documents look like SGML documents,
  17. but technically, they are not. So I have tried to come up with a DTD that
  18. captures the features of HTML.
  19.  
  20. I have come to the conclusion that HTML has very little structure, and that this
  21. is by design.
  22.  
  23. I am beginning to wonder how much the needs of WWW have in common with the
  24. features of SGML.
  25.  
  26. It seems to me that SGML is the technology of choice when you have a community
  27. of information consumers and producers that share a common structure. e.g. the
  28. construction industry might use SGML to exchange bill of materials, parts lists,
  29. inventories, etc. The SGML parser would be used to verify part numbers, make
  30. sure every widget has a corresponding gadget, etc.
  31.  
  32. The WWW project is a form of electronic publishing, however, and publishing is a
  33. natural application of SGML. But the value of SGML is that you can verify the
  34. structure of the text. A publisher can specify in his DTD the format
  35. of references, bibliography entries, the placement of the abstract, etc.
  36.  
  37. The WWW project has no such editorial policies to enforce. The editorial
  38. policies set forth in the HTML tag set are things like "you can have a title, if
  39. you want, and we'll keep it visible for the user; you can have headings and
  40. paragraphs and glossaries and lists and menus, and as long as you use them
  41. in pretty much the traditional way, they'll be formatted reasonably. And
  42. you can have anchors -- references from/to other documents."
  43.  
  44. The question that recently came into my mind is: why is the WWW project
  45. defining such a tag set? The practical answer is that the NeXT implementation
  46. has a nifty editor, and we'd like to be able to write nicely formatted documents
  47. and display them nicely on nice terminals and simply on simple terminals.
  48.  
  49. Honestly, for that purpose, RTF is a more mature technology. The NeXT has
  50. extensive support for RTF, and the Mac and the PC have some support.
  51.  
  52. I think all we're lacking is public implementations of RTF->ASCII,
  53. RTF->Postscript, and RTF->X Windows renderers. MS Word and NeXT
  54. edit would be fine editors. Really, for the kind of casual documents
  55. the WWW project deals with, SGML is not a good match. Who really
  56. uses all the "format independent" features of WWW? I haven't seen
  57. anything that the RTF stylesheet features can't handle.
  58.  
  59. Unless we want some part of the WWW system to verify the structure
  60. of documents, why are we using SGML (and using it poorly)?
  61.  
  62. Granted RTF doesn't have very good hypertext and multimedia features,
  63. but that's what the WWW project is all about: experimenting with
  64. hypertext and multimedia. We could standardize multimedia RTF conventions
  65. as well as we have done for SGML.
  66.  
  67. Comments?
  68.  
  69. Dan